Um SGBD com Armazenamento Distribuído de Dados Baseado em DHT
نویسندگان
چکیده
This paper investigates the development of a DHT-based storage engine for a database management system (DBMS). The storage engine is responsible for implementing the interface between an SQL query processor and a DHT, by translating operations based on relations to DHT standard operations. By combining DHTs to DBMSs we achieve scalability, decentralization, and fault tolerance, due to a DHT-based relational storage, and also a general high level language for querying data stored on DHTs. Our experimental study shows some initial results on two issues. The first determines the impact of developing an indexing structure on top of a DHT for processing range queries. The second investigates two approaches for mapping relations to DHT’s key-value pairs: vertical and horizontal partition of relations. Resumo. Este artigo apresenta o desenvolvimento de um módulo de armazenamento baseado em Tabelas de Espalhamento Distribuı́das (DHT) para um Sistema Gerenciador de Banco de Dados (SGBD). O módulo integra a máquina SQL com a DHT, traduzindo para o formato de utilização da DHT as operações de inclusão, leitura, atualização e remoção de dados estruturados em forma de tabelas. Unindo as propriedades da DHT às propriedades do banco de dados, é possı́vel desenvolver um sistema altamente escalável, descentralizado, tolerante a falhas e que seja de fácil utilização para o armazenamento de dados no modelo relacional. São apresentados resultados de dois experimentos. O primeiro tem por objetivo determinar o impacto de uma estrutura de indexação sobre a DHT para o processamento de consultas por intervalo de valores. O segundo investiga duas formas de realizar o mapeamento entre o modelo relacional e o modelo chave-valor, utilizado pelas DHT: a fragmentação horizontal e a fragmentação vertical de tabelas.
منابع مشابه
Projeto de banco de dados de simulações numéricas
Resumo. Com a rápida evolução dos sistemas computacionais, simulações numéricas baseadas em modelagem computacional têm alcançado soluções cada vez mais realistas. Ainda assim, o processo de simulação é complexo, exigindo grande capacidade computacional e produzindo muitos arquivos auxiliares com os resultados das simulações. Uma grande quantidade de arquivos, como os produzidos durante o proce...
متن کاملUma Abordagem para Armazenamento de Dados Semi-Estruturados em Bancos de Dados Relacionais
This paper presents an approach to storing semistructured data in relational databases. We focus on semistructured data as extracted from Web pages by a tool called DEByE (Data Extraction By Example), and organized according to its data model, the DEByE Object Model (DEByE-OM). The approach presented here consists in representing the structure of objects extracted by DEByE by a relational schem...
متن کاملUso de SGBDs NoSQL na Gerência da Proveniência Distribuída em Workflows Científicos
Resumo. Um fator fundamental na gerência de experimentos modelados como workflows científicos são seus dados de proveniência. Esses dados basicamente são usados para garantir a reprodutibilidade, porém nos últimos anos eles também vêm sendo usados para tarefas de monitoramento e escalonamento de atividades. Como essas tarefas demandam consultas em tempo real, conforme a quantidade de dados de p...
متن کاملReindexação Automática em SGBDs Relacionais
We propose a solution to the automatic and online reindex problem. The proposed mechanism runs continuously and with almost no human intervention. The adopted strategy is based on ad-hoc heuristics that monitor the index fragmentation level and, when necessary, reindex it automatically. We have actually implemented our ideas within the PostgreSQL DBMS code. Practical performance tests show the ...
متن کاملModelagem de Tráfego VoIP Utilizando Misturas Gaussianas Ajustadas por Algoritmo de Maximização de Esperança e Comprimento de Descrição Mínimo
Resumo: O aumento do número de aplicações que geram tráfego VoIP (Voice over IP) requer que modelos adequados para este tipo de tráfego sejam empregados para um melhor dimensionamento dos recursos da rede. Neste artigo, propomos a aplicação de Misturas Gaussianas ajustadas por um algoritmo EM (Expectation − Maximization) com seleção de número de classes utilizando o princípio do Comprimento de ...
متن کامل